这项工作提出了用于诊断计算方法的分类法,该方法允许其标准化的评估,分类和比较。目的是(i)使研究人员和从业者对可用诊断技术的各种景观的印象,(ii)允许他们轻松地检索主要功能以及方法的优点和缺点,(iii)启用了轻松且易于根据其特征WRT的技术进行明确比较。重要且定义明确的属性的列表,以及(iv)促进为特定问题案例(例如,在实际诊断设置中,用于比较实验评估)或重用,修改,修改,修改,修改,扩展或研究过程中的改进。
translated by 谷歌翻译
各种基于模型的诊断方案需要计算最优选的故障解释。但是,现有的声音算法(即仅输出实际故障说明)并完成(即可以返回所有说明),但是,需要指数空间才能完成此任务。作为一种补救措施,为了在内存限制的设备上成功诊断和记忆密集型问题案例,我们提出了RBF-HS,这是一种基于KORF众所周知的RBFS算法的诊断搜索方法。 RBF-HS可以在线性空间范围内以最佳优先级的方式列举任意固定数量的故障解释,而无需牺牲理想的声音或完整性属性。使用现实世界诊断病例的评估表明,RBF-HS在计算最小心电图解释时,在大多数情况下,可以节省大量空间(最多98%),而仅需要比Reiter的HS-Tree(相比)更多或更少的时间,通常使用的,通常是适用的声音,完整,最好的诊断搜索。
translated by 谷歌翻译
为了代表,统计样本必须以随机和公正的方式从人群中获取。然而,在基于模型的诊断领域的常见做法是从(偏见)最佳先前样本进行估计。一个例子是计算有缺陷系统的一些最可能的故障解释,并使用这些解释来评估系统的哪个方面(如果测量)将带来最高的信息增益。在这项工作中,我们仔细检查了这些在统计学上没有得到充分的惯例,即诊断研究人员和从业人员已经遵守了数十年的认可,这确实是合理的。为此,我们通过经验分析了产生故障解释的各种抽样方法。我们研究了产生的样品的代表性,这些样本的估计以及它们指导诊断决策的指导程度以及我们研究样本量的影响,采样效率和有效性之间的最佳权衡以及如何比较采样技术的影响确切的。
translated by 谷歌翻译
公司的一个普遍问题是,产品订单的量有时可能超过生产能力。我们正式介绍了两个新的问题,该问题处理了一个问题,该问题要丢弃或推迟以实现某些(及时性)目标,并尝试通过基于模型的诊断来接触它们。在彻底的分析中,我们确定了诊断问题引入的问题的许多相似之处,但也揭示了关键的特质和概述处理或利用它们的方法。最后,对工业规模的问题实例的概念验证评估来自众所周知的调度基准套件,这表明,基于开箱即用的模型诊断工具可以很好地攻击两个形式化问题之一。
translated by 谷歌翻译
我们挑战现有的基于查询的本体故障本地化方法WRT。他们做出的假设,优化的标准以及相互作用意味着它们使用。我们发现它们的效率在很大程度上取决于相互作用的专家的行为,进行计算的计算效率低下或不精确,并且使用的优化标准通常不完全现实。作为一种补救措施,我们建议一种新颖(和简单)的互动方法,它克服了所有确定的问题,并且在有关错误现实世界本体论的全面实验中,可以成功地定位错误,同时需要在66%的情况下进行更少的专家互动,并且始终需要更少与现有方法相比,专家等待时间至少减少了80%。
translated by 谷歌翻译
Ulrich Junker在2004年的开创性论文中提出了QuickXplain算法,该算法提供了一种分裂和拼接计算策略,以在给定的集合中找到具有特定(单调)属性的不可约子集。除了其在约束满意度问题领域的最初应用外,该算法从那以后发现在与基于模型的诊断,推荐系统,验证或语义网等区域的广泛采用。这种受欢迎程度是由于一方面发现不可还原子集以及QuickXplain的一般适用性和有利的计算复杂性的问题。但是,尽管(我们经常体验)人们很难理解QuickXplain,并且了解其工作正常的原因,但该算法的正确性证明从未出版过。这是我们在这项工作中所说的,通过以小说和测试的方式解释QuickXplain,并通过提供可理解的形式证明。除了显示算法的正确性并排除了后来的错误(证明和信任效应)之外,正式证明的可用性的附加值还包括,例如(i)算法的工作通常仅变得完全清楚在研究,验证和理解证据(教学效应)之后,(ii)所示的证明方法可以用作证明其他递归算法(转移效应)的指导,以及(iii)提供“无间隙”正确性证明的可能性依靠QuickXplain(计算结果计算的结果)的系统,例如众多基于模型的调试器(完整性效应)。
translated by 谷歌翻译
现实世界的语义或基于知识的系统,例如在生物医学领域,可能会变得大而复杂。因此,对此类系统知识库中故障的本地化和修复的工具支持对于它们的实际成功至关重要。相应地,近年来提出了许多知识库调试方法,尤其是基于本体的系统。基于查询的调试是一种相似的交互式方法,它通过向知识工程师提出一系列问题来定位观察到的问题的真正原因。存在这种方法的具体实现,例如本体论编辑器的OntodeBug插件prof \'eg \'e。为了验证新提出的方法比现有方法有利,研究人员通常依靠基于模拟的比较。但是,这种评估方法有一定的局限性,并且通常无法完全告知我们方法的真实性。因此,我们进行了不同的用户研究,以评估基于查询的本体调试的实际价值。研究的一个主要见解是,所考虑的交互方法确实比基于测试案例的替代算法调试更有效。我们还观察到,用户经常在此过程中犯错误,这突出了对用户需要回答的查询的仔细设计的重要性。
translated by 谷歌翻译
当本体学达到一定的规模和复杂性时,几乎无法避免诸如不一致,不满意的课程或错误的课程等故障。找到导致这些故障的不正确的公理是一项艰巨且耗时的任务。在解决这个问题时,已经提出了几种针对本体学中半自动断层定位的技术。通常,这些方法涉及一个人类专家,该专家为有关预期(正确)本体的系统生成的问题提供答案,以减少可能的故障位置。为了提出尽可能多的信息性问题,现有的方法借鉴了各种算法优化以及启发式方法。但是,这些计算通常基于有关交互用户的某些假设。在这项工作中,我们表征和讨论不同的用户类型,并表明现有方法并不能为所有用户实现最佳效率。作为一种补救措施,我们建议一种新型的专家问题,旨在适合所有分析专家的答案行为。此外,我们提出了一种算法,以优化与现场使用的(尝试和测试的)启发式方法完全兼容的新查询类型。关于现实世界中错误的实验表明,新的查询方法的潜力是将专家咨询时间最小化,而与专家类型无关。此外,获得的见解可以为互动调试工具的设计提供信息,以更好地满足用户的需求。
translated by 谷歌翻译
给定故障系统,顺序诊断旨在确定在异常行为的系统组件方面识别失败的根本原因。由于最初的系统观察通常不足以确定性地固定系统的不当行为,因此其他系统测量可以帮助区分可能的解释。目的是限制解释的空间,直到只剩下一个(高度可能)的解释。为了通过一组最小成本的测量值来实现这一目标,已经提出了各种选择最佳下一个测量值的(主动学习)启发式方法。我们报告了广泛的正在进行的实验的初步结果,并在现实世界诊断病例上进行了一系列选择启发式方法。特别是,我们试图回答诸如“某些启发式词总是比其他所有人都优越?”之类的问题,“特定启发式方法的(相对)性能取决于哪些因素?”或“在哪些情况下我应该使用启发式方法?”
translated by 谷歌翻译
We consider the contextual bandit problem on general action and context spaces, where the learner's rewards depend on their selected actions and an observable context. This generalizes the standard multi-armed bandit to the case where side information is available, e.g., patients' records or customers' history, which allows for personalized treatment. We focus on consistency -- vanishing regret compared to the optimal policy -- and show that for large classes of non-i.i.d. contexts, consistency can be achieved regardless of the time-invariant reward mechanism, a property known as universal consistency. Precisely, we first give necessary and sufficient conditions on the context-generating process for universal consistency to be possible. Second, we show that there always exists an algorithm that guarantees universal consistency whenever this is achievable, called an optimistically universal learning rule. Interestingly, for finite action spaces, learnable processes for universal learning are exactly the same as in the full-feedback setting of supervised learning, previously studied in the literature. In other words, learning can be performed with partial feedback without any generalization cost. The algorithms balance a trade-off between generalization (similar to structural risk minimization) and personalization (tailoring actions to specific contexts). Lastly, we consider the case of added continuity assumptions on rewards and show that these lead to universal consistency for significantly larger classes of data-generating processes.
translated by 谷歌翻译